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Введение. Рассмотрено функционирование искусственного интеллекта (ИИ) в системах хранения данных. 
Определено преимущество его использования при работе с данными как с экономической точки зрения, так и с 
точки зрения безопасности. Целью работы является внедрение искусственного интеллекта в системы хранения 
данных. Основные задачи: описание методов разделения данных, организации их хранения и противодействия 
угрозам безопасности. 

Материалы и методы. Данные, которые необходимо занести на накопители, разбивается на части таким обра- 
зом, чтобы их можно было восстановить, не имея одной из частей. Это необходимо для того, чтобы иметь воз- 
можность доступа и восстановления информации в случае программного или аппаратного сбоя. 

Результаты исследования. Рассмотрена работа искусственного интеллекта при обнаружении угроз безопасно- 
сти. Так как модель подразумевает взаимодействие пользователей с данными, то было выяснено, каким образом 
происходит управление доступом данных, а также приведено описание способа хранения ключей. 

Обсуждение и заключения. Использование искусственного интеллекта при организации хранилища данных 
позволит увеличить скорость работы системы. Искусственный интеллект с встроенными алгоритмами машин- 
ного обучения позволит реагировать на ситуацию, влияющую на состояние системы. Анализ состояния накопи- 
телей позволит избежать возможного аппаратного или программного сбоя. Минимизация человеческого факто- 
ра в функционировании системы способствует улучшению её работы. 
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Введение. На современном этапе развития информационных и телекоммуникационных технологий че- 
ловек встречается с различного рода информацией. Актуальным является вопрос хранения этих данных в без- 
опасном месте. Хранением информации в зашифрованном виде занимается криптография — наука, изучающая 
способы сокрытия данных и обеспечения их конфиденциальности". 

Во всех реализациях хранения данных информация содержится статично. То есть, данные будут нахо- 
диться там, где они оказались первый раз. На другой диск или другой сектор информация может попасть только 
после удаления еб с первоначального местоположения. Однако данный факт можно выделить как недостаток 
существующих алгоритмов. 

Для повышения эффективности защиты рекомендуется проводить разделение данных [1] с целью хра- 
нения их частей. Это позволяет организовать отказоустойчивые хранилища, в которых организованы алгорит- 
мы восстановления информации в случае какого-либо сбоя, выхода из строя одного из накопителей, а также в 
случае утери одной или нескольких частей данных. 

Если злоумышленник имеет доступ к диску, он сможет получить необходимую информацию. При ста- 
тичном хранении в случае получения доступа к нескольким таким дискам, нелегитимный пользователь может 
воссоздать информацию. Хранение данных в разобщенном виде повышает защищенность информации. Кроме 
того, в больших хранилищах, как правило, используются накопители на жестких магнитных дисках, у которых 
скорость работы (проведения операций чтения и записи) существенно ниже, чем у твердотельных $5) и флэш- 
накопителей °. В связи с этим приходится выбирать между используемым объёмом и скоростью работы. 

Цель работы — описать функционирование искусственного интеллекта в системах хранения данных. В 
работе поставлена задача — описать алгоритмы работы ИИ при выполнении следующих операций: 

® — запись данных на накопители; 

® — обращение пользователей; 

® — анализ хранилища данных; 

» — в случае угроз безопасности информации. 

Влияние искусственного интеллекта на качество работы системы хранения. В современных 
устройствах, таких как смартфоны и компьютеры, разработчики уделяют особое внимание внедрению искус- 
ственного интеллекта. В данных технологиях реализованы алгоритмы машинного обучения, что увеличивает 
скорость работы и сокращает время отклика на проведение часто повторяющейся информации. Следует рас- 
смотреть, каким образом внедрение искусственного интеллекта и машинного обучения в системы хранения 
позволят существенно повысить качество их работы [2]. 

В настоящее время крупные компании и организации начинают внедрять ИИ в свои хранилища дан- 
ных. Широкое внедрение технологий машинного обучения и искусственного интеллекта способствует повыше- 
нию качества работы на уровне управления. Это облегчает работу администраторам сети и хранилища данных 
путем постоянного диагностирования причин перегрузок и снижения трафика, что позволит им заблаговремен- 
но определять потенциально уязвимые сегменты используемой модели. 

Искусственный интеллект подразумевает использование интегрированных алгоритмов глубокого обу- 
чения, которые смогут прогнозировать состояние всей системы и оперативно реагировать на возможные изме- 
нения. Это позволит существенно сократить расходы по ликвидации последствий, вызванных выходом из строя 
оборудования. Кроме того, внедрение искусственного интеллекта в организацию отказоустойчивых хранилищ 
позволит обеспечить их автоматизацию [3]. Под этим подразумевается анализ состояния системы и обработка 
поступающих данных в динамическом режиме. 

Искусственный интеллект и машинное обучение позволят минимизировать вероятность потери дан- 
ных. В совокупности с избыточными массивами независимых дисков такая система увеличивает доступность и 


* Рябко Б. Я., Фионов А. Н. Кринтография в информационном мире. М., 2018. 305 с. ОВГ: Врз://\уилу лесНбоок.п/боок.рНр?14 Боок=1001 
(дата обращения: 04.05.2020). 
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скорость выхода из вынужденного простоя благодаря интеллектуальному восстановлению данных, стратегии 
резервного копирования и переноса необходимых данных [4]. 

Распределение данных по входным параметрам. Для хранения данных в разделенном виде могут 
быть использованы методы порогового разделения. В классических алгоритмах входные параметры — статич- 
ные величины, что является существенным недостатком. Получение доступа к одним данным путём подбора 
входных параметров ставит под угрозу все остальные данные в системе. 

Таким образом, наибольшее предпочтение в рамках информационной безопасности отдается тому ал- 
горитму, который использует различные входные параметры для порогового разделения. Эти параметры могут 
генерироваться случайным образом по определенному алгоритму или зависеть непосредственно от входных 
данных, которые будут соответствующим образом проанализированы для подбора наиболее предпочтительных 
параметров. Генерацией таких параметров будет заниматься непосредственно искусственный интеллект. При 
этом он должен учитывать количество пользователей, которым доступна эта информация. Такие данные как 
параметры порогового разделения и местонахождение первой доли хранятся в базе. Эта база данных находится 
в зашифрованном виде на ключах конкретных пользователей, что соответствует использованию ассиметрично- 
го алгоритма шифрования. 

Параметры предлагаемого алгоритма по обеспечению надежности данных. Искусственный интел- 
лект при распределении данных по накопителям использует следующие параметры: скорость работы накопите- 
лей, их доступность, свободный объем и показатель надёжности. При этом ИИ для вычисления использует па- 
раметры ценности данных, размер и частоту обращений к ним. 

Алгоритм распределения долей данных по накопителям основан на вычислении коэффициентов нако- 
пителей. Для определения скорости работы накопителя 5 необходимо найти среднее арифметическое скорости 
записи 5.ап и скорости чтения 5.т: 

5= 5зап+5чт 
2 

Доступность накопителя А (ауа|ЙабИу) имеет 3 уровня: 0 — недоступен, | — частая ситуация недо- 
ступности накопителя, 2 — редкая ситуация недоступности накопителя, 3 — постоянно доступен. Показатель- 
ный коэффициент накопителя может быть выражен по формуле: 

Кн =5.А.И- В, 
где Г — объём диска; РА (тенаб у) — надёжность, она ранжируется от 1-го до 10-и баллов; А — количество обраще- 
ний к файлу за определённый промежуток времени. 

Коэффициент значимости файла К‹ зависит от уровня ценности (1 — низкая, 2 — средняя, 3 — высо- 
кая). На основании известных атрибутов этот параметр можно вычислить по формуле: 

Кь =5.И:А. 

Рассмотрим способ выбора накопителя хранения остальных файлов. Для определения приоритета 
накопителя используем номер файла тп. в отсортированной таблице по убыванию параметра Къ. Тогда номер 
диска №1, участвующего в выборке для хранения первой доли данных будет найден по формуле: 


а - Пт 
№, = гоипа -;“) то4 п>, 


где 4 — количество дисков, используемых для хранения; Г — количество файлов в системе; п› — количество 
накопителей; гоипа — округление к ближайшему целому. 

Таким же образом определяется диск №, который возможно будет выбран в качестве накопителя для 
хранения первой доли: 

Клтзь = Ку" Катах, 

где Къ — коэффициент разбиваемого файла; Ка.тах — максимальный коэффициент накопителя. 

Далее в качестве №› выбирается тот накопитель, у которого разница коэффициентов Крё.ё И Кн мини- 
мальна. Для хранения первой доли случайным образом выбирается один из найденных дисков №; и №. 

Преимущества рассмотренного алгоритма распределения данных по накопителям. Классически 
диски, объединенные в один массив данных (КА/-массив), работают по статичному алгоритму. То есть при 
обнаружении первой доли данных можно провести процедуру поиска второй доли. Каждый раз, при обнаруже- 
нии очередной доли вероятность определить конкретный алгоритм распределения повышается. В предложен- 
ном алгоритме распределение происходит на основе информационных данных и накопителей. Другими слова- 
ми, задача нахождения всех долей данных является №Р-полной, то есть не решаемой за полиномиальное время. 
Из этого следует, что использование данного алгоритма повышает надежность системы хранения информаци- 
онных данных. 
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Однако, пользователи не создают ключ, он генерируется в автоматическом режиме и хранится на 
устройствах самих пользователей. Таким образом, при попытке расшифровать данные должен использоваться 
конкретный ключ, иначе данная операция завершится неудачно. Местонахождение ключей изменяется динами- 
чески с учетом времени. Такие изменения могут происходить в определенные часы, либо через какой-либо 
промежуток времени [5]. Искусственный интеллект отвечает за местоположение ключа с учетом доступности 
всех устройств, подключенных к системе. Это позволяет усложнить работу злоумышленнику, чьей целью явля- 
ется доступ к информации, хранящейся на накопителях [6]. 

Так как информацией, находящейся в хранилище, оперируют пользователи, следует определять, кому 
из них разрешено проводить операции с данными, другими словами, как разграничивать доступ к данным. 

Сравнение доступа происходит по таблице хеш-сумм '. Если у пользователя есть доступ к данным, то 
они восстанавливаются. В случае отсутствия записи в базе данных о предоставлении прав доступа, субъекту, 
запросившему доступ к объекту, в нём будет отказано. Кроме того, попытка получения доступа будет зафикси- 
рована в лог-файле, а субъект, которому принадлежит хранимая в системе информация, будет проинформиро- 
ван о попытке получения доступа к его данным нелегитимным пользователем или субъектом. Искусственный 
интеллект в данном случае анализирует действия каждого пользователя с целью принятия того или иного ре- 
шения в случае возникновения определенной ситуации. Например, он определяет, является ли запрос ошибоч- 
ным или имеет какую-либо цель [2]. 

На рис. 1 представлен пример предоставления доступа на восстановление данных и отказ в доступе с 
занесением события в лог-файл и уведомлением пользователя. 
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Рис. 1. Предоставление и отказ доступа на восстановление данных 

Рассмотрим функцию управления доступом. Так как в системе основными субъектами являются поль- 
зователи, то вопрос предоставления доступа к данным является особо актуальным. Очень важен полный кон- 
троль над операциями пользователей. Решение о предоставлении доступа к данным принимает распределяющее 
устройство с поддержкой искусственного интеллекта. Использование ИИ в данном случае позволит увеличить 
скорость работы пользователя над его данными. Это достигается путём трансформации наиболее часто исполь- 
зуемой пользователем информации, что позволяет избежать ожидания времени отклика на отправленный за- 
прос о восстановлении данных. 

Рассмотрим динамическое изменение хранилища. В определенных случаях искусственный интеллект 
управляет переносом данных и отвечает за резервное копирование и восстановление данных, в т. ч. с учетом 
времени. При этом данные мигрируют с одного диска на другой, а информация в базе данных также изменяет- 
ся. Это позволяет минимизировать вероятность прогнозирования состояния системы в конкретный момент вре- 
мени. Так как все ключи генерируются на основе предыдущих последовательностей с использованием хеш- 
сумм, задача нахождения ключа, предназначенного для расшифровывания базы данных является МР-полной 
задачей [7]. Искусственный интеллект в данном случае анализирует состояние накопителей, а также системы в 
целом. При обнаружении неисправности происходит перенос данных с тех дисков, на которых замечены сбои. 
Это позволит минимизировать вероятность потери информации. 

При обнаружении угрозы искусственный интеллект анализирует атаку с целью обнаружения её цели. 
Если конечной целью является объект хранилища, то данные с него переносятся на другой накопитель. Таким 


' Легкий способ подделки контрольной суммы с помощью коллизий / хаКер.га. ОВГ: В&рз://хаКер.га /2012/11/22/ 1 4-{аКе-свескзит/ (дата 
обращения: 04.05.2020). 


Информатика, вычислительная техника и управление 


— 
№) 
\о 


В р://уезвиК.оп$еа.ги 


200 


Вестник Донского государственного технического университетиа. 2020. Т. 20, № 2. С. 196-200. 155М 1992-5980 е155М 1992-6006 
Резий оГ оп 5ие Тесйшси Отуегуйу. 2020. Ио. 20, по. 2, рр. 196-200. 155М 1992-5980 е155М 1992-6006 





образом, в случае успешной атаки, ИИ будет предпринимать эффективные действия для сокрытия информации 
[8]. 

Поскольку с данными работают пользователи, то важную роль играет человеческий фактор. Поэтому 
система устроена таким образом, чтобы с данными могли работать только те пользователи, у которых имеется 
доступ. Здесь есть аналогия с мандатной моделью управления доступом. Исключением является то, что разда- 
чей доступа управляет пользователь, создавший информацию в системе и являющийся её владельцем. 

Заключение. Таким образом, использование искусственного интеллекта при организации хранилища 
данных повышает скорость работы системы. Ограничение доступа пользователей в алгоритме работы системы 
улучшает информационную безопасность. Искусственный интеллект с встроенными алгоритмами машинного 
обучения позволит оперативно реагировать на любую ситуацию, влияющую на состояние системы. Анализ со- 
стояния накопителей позволит избежать возможного аппаратного или программного сбоя. Минимизация чело- 
веческого фактора в работе системы способствует улучшению её функционирования и более глубокому анали- 
зу пользовательских запросов. Кроме того, сбор информации о возможных атаках позволит поддерживать на 
должном уровне безопасность системы. 
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